Vers l'exploitation de grandes masses de données

نویسندگان

  • Raphaël Féraud
  • Marc Boullé
  • Fabrice Clérot
  • Françoise Fessant
چکیده

Résumé : Une tendance lourde depuis la fin du siècle dernier est l'augmentation exponentielle du volume des données stockées. Cette augmentation ne se traduit pas nécessairement par une information plus riche puisque la capacité à traiter ces données ne progresse pas aussi rapidement. Avec les technologies actuelles, un difficile compromis doit être trouvé entre le coût de mise en œuvre et la qualité de l'information produite. Nous proposons une approche industrielle permettant d'augmenter considérablement notre capacité à transformer des données en information grâce à l'automatisation des traitements et à la focalisation sur les seules données pertinentes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Big Data - Retour vers le Futur 3; De Statisticien à Data Scientist

L'évolution rapide des systèmes d'information gérant des données de plus en plus volumineuses a causé de profonds changements de paradigme dans le travail de statisticien, devenant successivement prospecteur de données, bio-informaticien et maintenant data scientist. Sans souci d'exhaustivité et après avoir illustré ces mutations successives, cet article présente brièvement les nouvelles questi...

متن کامل

Large-scale acoustic and prosodic investigations of french. (Analyses acoustiques et prosodiques du français à partir de grandes masses de données orales)

ii This thesis was partially financed by RTRA-DIGITEO, Région Île-de-France, under the projet AMADEO (Apprentissage à partir de grandes masses de données orales, 2007-01D), and by the OSEO Quaero program.

متن کامل

Exploitation de l'échelle d'écriture pour améliorer la reconnaissance automatique des textes manuscrits arabe

RÉSUMÉ. Les documents manuscrits arabes présentent des défis spécifiques pour la reconnaissance du fait de la nature de l'écriture cursive et d'autres facteurs, comme la taille de l'écriture. Une des plus grandes bases étiquetées des documents manuscrits arabes, la base de données NIST­OpenHaRT inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons ...

متن کامل

Rôle et techniques de l'alignement d'ontologies : un survol de l'état de l'art

Le besoin d’intégrer et d’analyser des grandes masses est présent dans de nombreux domaines d’applications. Le problème de l’alignement d’ontologies/schémas dont le résultat est un ensemble de correspondances entre différentes représentations du monde réel, est au centre du processus d’intégration des données. En effet, l’intégration de données est motivée par la forte hétérogénéité des données...

متن کامل

Visualisation de graphes avec Tulip : exploration interactive de grandes masses de données en appui à la fouille de données et à l'extraction de connaissances

LaBRI UMR 5800 Université Bordeaux I 351 Cours de la Libération 33405 Talence Cedex – France {auber,maylis,domenger,mary}@labri.fr www.labri.fr Département de mathématiques et d’informatique Université du Québec à Chicoutimi 555, boulevard de l’Université Chicoutimi, G7H 2B1 – Canada [email protected] wwwdim.uqac.ca INRIA Futurs & LIRMM UMR 5506 161 rue Ada 34392 Montpellier Cedex 5 – Fran...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008